查看原文
其他

统计方法如何表达:茶与癌症的关系的队列研究

老郑 医学论文与统计分析 2022-10-07

        

   

       诸位,本公众号现在已经形成包括“样本量周一见”“医学研究进展”“论文的统计表达方法”“统计视频”(R、医学统计学)、“科研工具合集”等若干系列,有兴趣请点击学习。本周将开启“真实世界临床研究回归建模方法”,敬请期待。       

     


        昨日,本公众号发布2019年7月北京大学教授李立明教授发表的一篇论文《茶与癌症:50万队列研究》,认为饮茶与癌症无关,甚至可能会增加癌症风险,许多朋友质疑这一结果科学性。现在,与诸位交流下该论文统计学方法学,看统计学方法是否有效解决论文科学性的问题。该论文科普性报道《北京大学李立明教授分析50万中国人发现,喝茶可能不防癌》,已与本篇文章共同发布在公众号中,有兴趣者可以关注并阅读。



 本篇论文统计方法你将学到以下关键知识

  • COX回归分析对应用条件的统计方法和文字描述

  • 趋势性检验它是如何进行文字描述的

  • 文章如何阐述做交互与分层分析

  • 敏感性分析做了哪些,是今后诸位可以借鉴的


       



一、文章概述


      本文主要基于2008年建立的中国50万人群前瞻性队列,其总研究人群数为455981人,平均随访10.1年。

      本队列研究的暴露因素为喝茶频率通过调查对象自报得到饮茶的频率和数量,同时论文团队将人群分为每周饮茶少于一次者、每周多余一次者,每日喝茶者(每日喝茶者根据茶量又分为三档:<2g,2-4g,>4g)

      研究结局,是随访期间发生是否发生癌症,以及调查对象的生存时间。结局又分为以下几类:总癌症、肺癌、胃癌、结肠癌、肝癌、女性乳腺癌和宫颈癌。

      既然是队列研究,那么肯定少不了一系列的协变量(混杂变量),这里不再罗列,该文章用单独一章进行了陈述


二、统计学策略


队列研究的统计学方法是什么呢?如果要明确暴露因素与结局的关系,一般情况下可采用线性回归、logistic回归和COX回归。由于本研究是随访研究,随访时间(生存时间)和随访结局,那么COX回归是首选方法。研究一般会通过构建COX回归,调整协变量的混杂效应,从而实现科学评价暴露因素的效应。


三、论文统计方法与表达


第一段:

 本研究进行了统计描述和差异性比较,但文字描述时,没有写出来,直截了当指出,我们采用人年的概念计算发病密度,采用COX回归方法构建回归模型,最后一句话是我们一般中文论文不太提,但很重要的,那就是COX比例风险模型应用的时候有个前提,风险比HR在任何时间都要保证不变。本文通过Schoenfeld residuals方法进行了诊断,发现条件成立。


第二段:

本段长篇累牍地指出了COX回归模型调整了哪些协变量来控制混杂因素,最后还指出论文还进行了趋势性检验。这里不再赘述。


第三段:

这一段在做什么呢?在做亚组分析(分层分析)、交互作用分析。这一个分析在论文扮演着重要的作用。为什么?因为如果光做COX回归,其结果固然是主要的,也是最重要的,但是论文深度不够,篇幅不够,《欧洲流行病学》显然会嫌弃。因此作者,做了一个分层分析,探讨不吸烟和不饮酒人群中,茶与癌症关系。吸烟或饮酒人群,茶与癌症的关系。接着还做了个交互效应分析(乘积交互:cross-prouduct term)。此外,论文还附带分析了,在不同饮茶水平下,吸烟和饮酒与肺癌的关系。这样一来,论文的内容就显得较为丰富,深度和广度都大大增加了。


第四段:

       这一段,也是高级流行病学论文需要的内容:敏感性分析。作者从2个角度进行了敏感性分析,探讨不同数据和统计学方法带来的影响。首先,作者担心研究对象入组后前3年,发病结局和饮茶暴露因素因果关系混乱,因此,排除了前三年的病例之后再进行分析。接着,作者在构建COX回归时,分析胃癌时候额外纳入消化性溃疡病变量、在分析肝癌时候纳入肝炎、肝硬化、胆结石变量,看看额外变量的影响。这又是为什么呢?这一点是作者考虑潜在中介变量的影响。一般情况下,消化性溃疡、肝炎、肝硬化、胆结石是茶与癌症的中介变量,在回归分析中不应作为协变量纳入进来。但是到底是不是中介变量,影响有多大,则可通过敏感性分析一窥究竟。


四、研究结果


      该文章分析了饮茶与各种癌症之间的关系,并将吸烟、喝酒分别作为研究变量也加入到了研究中做分层分析。在调整了包括家庭收入、学历、职业等各混杂变量之后,结果发现:饮茶与癌症似乎没有统计学关联!

      这里就陈列两张重要的结果表格:


第一张:茶与各种癌症的关系,这里列出肺癌、胃癌和总癌症

第二张:吸烟、饮酒分层分析后,饮茶和癌症的关系。


五、学习总结


对于这样一篇队列研究论文,统计学做了什么呢?

第一,统计描述和差异性检验,虽然文字未做描述,事实成立

第二,COX回归分析,这里细节是COX回归条件的判定

第三,多层次构建COX回归,从单因素COX(未调整),到调整性别,到多因素调整,到最后调整吸烟和饮酒。这样充分展示数据的结果,也是在测试暴露因素效应的稳健性。

第四,交互效应分析和分层分析。在存在着交互效应时,最好深入开展分层分析,让结果更丰富

第五,敏感性分析。经典流行病学论文,敏感性分析是不可或缺的。


                  本篇论文统计方法以下关键点,你学到了吗?

  • COX回归分析对应用条件的统计方法和文字描述

  • 趋势性检验它是如何进行文字描述的

  • 文章如何阐述做交互与分层分析

  • 敏感性分析做了哪些,是今后诸位可以借鉴的

       

本系列往期文章:

    1. 统计方法如何表达:来自文章“孕产妇玩手机影响孕周期和新生儿体重吗?”


     如果你觉得本篇论文好,敬请关注、并请分享给更多的朋友吧。点击“阅读原文”可看英文原文。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存